Tabla comparativa — APIs de IA (precios, capacidades y “eficiencia precio/rendimiento”)

Modelos “directos” (proveedores principales)

Proveedor	Modelos representativos (2025)	Precio entrada USD / 1M tokens	Precio salida USD / 1M tokens	Contexto máx.	Modalidades	Fortalezas	Regla de pulgar (eficiencia)
OpenAI	GPT-5 GPT-5 mini / nano GPT-4o	desde $1.25 (GPT-5) · $0.25 (mini)	desde $10 (GPT-5) · $2.00 (mini) · $20 (4o)	hasta 400K (GPT-5)	Texto, imagen; (audio/video con 4o y Realtime)	Razonamiento y código de alto nivel; ecosistema maduro; herramientas integradas	Generalista premium: GPT-5 = alta calidad por $/salida moderado; 4o = mejor latencia/multimodal
Google (Gemini)	Gemini 2.5 Pro Gemini 2.5 Flash / Flash-Lite	Pro: $1.25 (≤200k) / $2.50 (>200k) Flash: $0.30 · Flash-Lite: $0.10	Pro: $10 (≤200k) / $15 (>200k) Flash: $2.50 · Flash-Lite: $0.40	2M (Pro) · 1M (Flash)	Texto, imagen, audio, video; Live API	Ventanas gigantes y buen costo en Flash; “grounding” con Google Search	Volumen & contextos largos: Flash/Flash-Lite maximizan $/token; Pro para tareas complejas con 2M
Anthropic	Claude Sonnet 4 Claude Haiku 3.5	Sonnet 4: $3 · Haiku 3.5: $0.80	Sonnet 4: $15 · Haiku 3.5: $4	200K (serie Claude 4)	Texto e imagen (entrada); texto (salida)	Baja alucinación, seguridad/guardrails; batch y prompt caching claros	Calidad/seguridad: Sonnet 4 rinde muy bien en tareas críticas; Haiku = costo mínimo
Cohere	Command R+ Command R Aya Expanse	R+: $2.50 · R: $0.50 · Aya: $0.50	R+: $10 · R: $1.50 · Aya: $1.50	No publicado (varía por despliegue)	Texto; (visión/otras según modelo)	Enfoque enterprise, despliegues privados y compliance	Empresa: buena relación costo/seguridad; R+ compite en razonamiento a menor $ que Sonnet

Notas rápidas: los precios pueden cambiar por región, proveedor y modalidad (batch, cachés, “grounding”, etc.). Valores mostrados son por 1M tokens (entrada/salida). “Contexto” = ventana máx. de tokens que el modelo puede considerar en una solicitud.

Plataformas agregadoras (multi-modelo)

Azure OpenAI / Azure AI Foundry

Catálogo con OpenAI (y otros como Mistral, xAI, Meta, Cohere). Precios por token similares a los del proveedor, con opciones de Data Zones, SLAs empresariales, y residencia de datos.

El precio exacto depende del modelo/sku y región; revisar tabla oficial de Azure.

AWS Bedrock

Acceso a Anthropic, Meta, Cohere, Mistral y más. Se cobra por token (según modelo) y opcionalmente por Flows ($0.035 por 1.000 transiciones de nodo). Excelente para integrarlo con stack AWS.

Los precios varían por modelo y por si usas Provisioned Throughput.

Cómo decidir (ultra-resumen)

Escenario	Recomendación rápida
Mejor calidad general / agentes y código	GPT-5 (OpenAI). Si tu app es intensiva en contexto multimodal en tiempo real, evalúa GPT-4o.
Contextos gigantes al menor costo	Gemini 2.5 Flash (precio ultra bajo) o 2.5 Pro si necesitas 2M tokens.
Riesgo regulatorio / guardrails estrictos	Claude Sonnet 4 por robustez y controles; batch y prompt caching reducen coste.
Privacidad y despliegue corporativo	Cohere Command R+ o consumir vía Azure/Bedrock por residencia de datos/SLA.

Glosario express

Entrada/Salida: tokens que envías / que genera el modelo (se tarifican distinto).
Contexto: tamaño de ventana; más contexto = prompts/documentos más largos sin truncar.
Batch / cachés: modos o features que bajan 50% el costo o reducen precio de contexto repetido.